我獲得了Google全新Nano Banana AI模型的私人課程
開場介紹
我要直接說,Nano Banana,也就是Google的全新圖像模型,是目前最優秀的圖像模型。這正是我們一直想要的圖像模型功能。你可以放置產品、保持角色一致性、改變場景,還可以完全控制特定部分的編輯。基本上就像Photoshop一樣,只是你不需要雇用專人來編輯,只要使用自然語言就行了。
所以我邀請了Google AI團隊的資深成員Logan Kilpatrick來進行教學,展示如何充分運用這個模型。我認為很多人都會從這個特定模型中賺到錢。他們將能夠創造出令人驚艷的內容、轉換率高的廣告,甚至利用Nano Banana建立SaaS新創公司。你必須觀看這一集。這是對新技術的精彩演示,我迫不及待想聽聽你的想法。
Logan Kilpatrick介紹Nano Banana
今天我們要談論Nano Banana,也就是Gemini 2.5 Flash圖像模型,這是我們最新的Gemini頂尖圖像生成模型,特別專精於圖像編輯。大家現在正為這個模型瘋狂(沒有雙關語的意思)。我希望我們能看到一些模型實際運作的例子,甚至現場建構一些東西,展示實際的產品應用,以及你可以圍繞這個新模型建立什麼樣的公司。
學習目標
到這一集結束時,你應該能了解:
- 模型的功能是什麼?
- 它在哪些方面表現特別出色?
- 5到6個不同的想法,告訴你如何整合這個模型並開始建立產品
- 如何將其整合到現有產品中或圍繞這個模型建立新產品並投入生產
AI Studio平台介紹
平台概述
你可以免費使用這些模型,都在AI Studio上。如果你之前沒用過AI Studio,這是我們為開發者和AI建構者設計的平台,可以嘗試各種功能。
我們有兩個Gemini原生圖像體驗:
- 頂層介面:你可以進行各種提示,右手邊有模型下拉選單
- Build標籤:展示一系列演示應用程式,實際展示Nano Banana的新模型功能
模型特色
這個模型的速度值得注意。有很多編輯體驗或生成體驗通常無法建立,因為需要45秒的處理時間,用戶真的會坐著等待嗎?所以圍繞這個模型的速度,有一個有趣的產品角度。
成本也很低,大概每張圖像只要4美分。所以你可以讓人們盡情使用而不會破產,1000張圖像只要40美元。
實際應用演示
AI廣告生成
我建立了一個能夠上傳產品圖片然後轉換成各種廣告格式的功能。當你上傳圖像時,我會用新的Google Pixel 10照片,這完全是即興編程的。你可以看到左上角我的提示,只需要一次嘗試。
我們有不同的選項:
- 豪華雜誌廣告
- 地鐵內部廣告
- 都市壁畫廣告
地鐵廣告演示
讓我們嘗試地鐵內部廣告,因為我經常看到Notion的廣告在地鐵裡,我總是羨慕Notion團隊做這件事。
(演示結果)我覺得你可能真的會在實際地鐵中看到類似這樣的東西。這個地鐵看起來不太有趣,但在這個例子中Pixel手機很突出。
都市壁畫廣告
都市壁畫廣告感覺更有個性,但很酷。壁畫廣告總是吸引我的注意,因為它們不像廣告。這個結果真的很酷,我希望公司都這樣做。
如果你不是Google,只是一個20人或更少的團隊,你可以把這個放在X或Instagram上,人們會說「哇,這個壁畫在哪裡?」
這實際上創造了一個正循環,你會想「也許我們真的應該在現實生活中做一個壁畫」。
中場廣告:ideabrowser.com
Sam Altman,OpenAI的共同創辦人,說現在是「想法人」的時代,他說得對。現在是建立新創公司的絕佳時機。如果你聽這個播客,很可能你也這麼認為。
我認為你可以通過觀察趋势來找出應該建立什麼新創想法。這就是為什麼我建立了ideabrowser.com。每天你都會在收件箱中收到一個免費的新創想法,而且都有高品質的數據趨勢支持。
我們使用AI代理去搜尋人們在尋找什麼,他們對哪些產品有需求,然後我們把它裝在銀盤子裡給你檢查。
改進廣告內容
添加行銷標語
我注意到這個例子很棒,但缺少行銷標語或一些額外的背景資訊,路過的人可能不知道這是什麼產品。所以我要要求模型添加行銷標語作為其中的一部分,使用模型的原生功能將文字嵌入到實際創建的廣告中。
我想添加一個行銷標語到圖像本身的文字中,這樣當人們看到廣告時,他們不只看到產品,還能看到行銷標語。讓我可以手動添加這個UI,或者選擇讓模型為我想一個。
社群媒體素材生成
我還展示了另一個例子,靈感來自今天在X上看到的TBPN的社群素材。我基本上用一個提示即興創建了一個應用程式,基於這個素材風格來幫我製作類似的素材。
這個例子受到TBPN今天在X上發布的Taylor Swift訂婚風格啟發。我會輸入「Logan Kilpatrick發布了Nano Banana」,這會為我製作幾個很酷的社群素材,採用TBPN的主題風格。
內容創作的重要性
停止滾動的內容
社群內容關乎停止滾動的內容。是的,你可以放上你的照片,那是一張美麗的照片,你看起來很棒,但將其包裝在故事中會讓你在演算法中獲得更多關注、更多點讚、更多回覆,最終為你正在做的事情帶來更多客戶和品牌知名度。
過去要做這件事,你必須雇用懂Photoshop的人。現在你可以自己完成。
保持創意完整性
還有另一個層面。當你作為一個有故事要講或有想法的人,必須通過翻譯層(特別是當翻譯層是一堆人時),你會失去一些故事的保真度。這就是為什麼AI輔助工具很棒,因為我可以對這個想法進行迭代,確保我使用的工具實際上從保真度角度講述了我正在講述的同一個故事。
豪華雜誌廣告演示
廣告格式選擇
讓我們回到產品演示。我們有不同的選項:
- 豪華雜誌廣告
- 共同工作空間廣告
- 咖啡廳產品放置
豪華雜誌廣告對我來說最有趣,讓我們試試看。
AI生成標語
結果顯示:「為明天製造,為你啟發」。我喜歡這個,這真的很好。這實際上很顛覆性而且很好,就像什麼都沒說但同時說了很多,這正是你想要的。
雨天公車站廣告
讓我們再試一個雨天公車站廣告,因為我想看看會產生什麼標語。我也想知道它是否會考慮公車站廣告的背景來想出標語,比如會不會給我們防水故事之類的。
結果沒有標語,但我們得到了AI生成的Google標誌,我想這個標誌本身就是標語--這是Google,我們在賣Pixel。
圖像編輯功能
自然語言編輯
如果你想編輯這個圖像,如何用自然語言從這裡實際編輯它?
在這個體驗中有點困難,讓我把圖像取出來,然後進入另一個例子。你有兩個選擇:我們可以回到主聊天UI,我可以把圖像放進去開始做一堆事情。
添加自定義標語
讓我說「在Pixel圖像下添加標語『Pixel:AI書呆子的手機』」。這是最輕量級的版本。我認為如果你想要更多產品架構來幫助你,比如想要畫筆來突出顯示某些東西或圈選區域,這些在預設體驗中都不存在,但你可以在我們之前的build標籤中建立所有這些客制化功能。
Photoshop式編輯工具
我們還有另一個例子:Photo Editor。我會上傳圖像,然後我們有一堆不同的選項:濾鏡、修飾等。
精確編輯演示
點擊圖像進行精確編輯。我可以說「從這裡移除Google標誌」。這是即興編程的,所以有時電池可能放錯位置。
太棒了!它實際有效。它們確實有點幻覺,最終從手機中間移除了標誌,但總的來說,你可以直接獲得這些創意工具,這很酷。
濾鏡功能
我也想試試濾鏡。我們可以改變這個說「嘿,這裡有我想要的10個濾鏡」或「想出10個濾鏡」或「想出一個添加文字框的方法」之類的。所有這些無限內容客制化都是可能的。
重要的是,到目前為止我們看到的所有體驗都是完全免費的。理想情況下,你用這個建立一個很棒的產品,最終使用Gemini API等,但你不一定需要。這個體驗是免費的,沒有陷阱。
提示最佳實踐
編輯複雜性的限制
在提示方面有一些限制,主要是關於多輪對話的複雜性。當你在單一輪中要求大量編輯時。我認為最好的方法是進行非常精確的單一輪編輯。
模型能夠在單一輪中做多件事,如果你給出足夠精確的指示,但我認為如果你將多個指示層層疊疊,它經常會失去你要表達的要點。
利用模型的世界知識
值得注意的是,這個模型由我們今年早些時候發布的Gemini 2.5 Flash模型驅動。所以它確實有很多世界知識。你應該假設它在許多方面都是一個聰明的創意夥伴。
就像任何其他人一樣,如果有人在網路上與隨機創意承包商合作,你通常不會得到理想結果。我最近經歷過這種情況,我想要某人為我設計一堆T恤,我發送了一堆東西,得到結果後我說「這不是我想要的」,然後我回頭看我說的話,很明顯我給了不好的指示,這就是為什麼我對結果不滿意。
建議的編輯流程
- 對你想要的東西要精確
- 嘗試將這些分解為盡可能小的多步驟編輯
- 圖像品質不會因為多輪編輯而變差
- 你不需要在第一次編輯時就做對一切
AI家居設計應用
實際應用案例
我剛剛在幫助我女朋友決定她辦公室裡想要什麼顏色的百葉窗,我們想「有沒有應用程式可以做這個?」我想「我不知道,我們現在就做一個」,字面上只花了30秒,然後我們拍了一張圖像,她真的瀏覽了37種不同綠色色調的百葉窗或窗簾可能的樣子,她說「這就是我想要的」,直接到Amazon去買那些窗簾。
產品放置演示
讓我上傳一個場景,這是Demis和我在談話的照片。我會上傳一個產品。這是一個很好的例子,展示模型的世界知識發揮作用。
右邊的場景是Demis和我坐在倫�敦圖書館的椅子上。左邊的產品實際上是我們之前使用AI生成的廣告。
有趣的是,這個圖像中還有其他可見的東西,有汽車、一堆人、雨傘和公車站。所以模型必須對用戶要求的實際產品做一些假設。
神奇的產品放置結果
當我拖拽這個圖像過去時,它拿了那個截圖,將其設置在坐在Demis和我之間的小桌子上。現在有了一個小產品放置,展示了從我們剛剛創建的更廣泛圖像中提取出來的Pixel 10。
這太瘋狂了!有太多可能性了。
三個層級的使用方式
使用層級架構
我聽到的有三個層級的模型使用方式:
第一層級:聊天
最簡單的方式,任何人都可以開始使用聊天,理解它是如何工作的。
第二層級:Build標籤
使用build標籤,看看一些預先創建的即興編程應用程式,你可以使用並創造一些價值。
第三層級:客制化應用
一旦你習慣了,你就會理解這些工具的作用,但對於你的用例有一些限制,因此你想要根據你的需求創建一些個人軟體。
在我看來,對於聽這個節目的創辦人和商業建構者來說,大部分的解鎖將來自建立他們自己的即興編程應用程式,使用這些模型。
開發流程的延續
當你有了所有需要的控制權,如果你想要部署它並與一堆人分享,或者移動到GitHub,或者下載程式碼並移動到Cursor繼續即興編程,或者無論你的工作流程是什麼,你應該能夠繼續那種體驗。
它不需要停在AI Studio,我們設計它時就是這樣,你應該能夠使用你想要的任何工具,在你想要的任何生態系統中建構。但我們想要幫助你開始。
發展計劃和反饋
早期階段提醒
我們在故事的很早期階段。所以請盡可能給我們寬容,在這個體驗中會有粗糙的邊緣。請發送反饋給我們。我們在接下來幾個月有大量的東西要推出,在像Nano Banana這樣的模型上也有大量的發展,這很令人興奮。
反饋需求
如果有例子不能很好地工作,有你希望模型能為你的用例做的事情,請在網路上給我發郵件。像「我正在嘗試建立這個瘋狂的產品,今天不可能實現,不起作用,我希望模型能做X、Y、Z事情」這樣的郵件是最好的。我們很樂意幫助讓模型適用於人們試圖建立的任何產品。
為什麼要現在開始使用
競爭優勢
有一個競爭優勢的因素。知道這個模型存在並正在用它建構東西的人數量相當有限。所以如果你在圍繞這個創建產品體驗的浪潮中比較早期,我認為消費者對這種用例有巨大的興趣。
市場機會
如果你看看實際可用來服務對此感興趣的客戶的產品,選擇相當有限,可能只有少數幾個產品真正存在。所以如果你建立一些東西並且經過深思熟慮,讓它進入人們的手中,我認為你會從很多用戶那裡得到這種「天哪」的體驗,他們只是從未體驗過類似的東西。
如果你向街上的普通人展示這是可能的,這會讓他們大吃一驚。所以我認為建立那種體驗有一些緊迫性,因為很多人都會去嘗試。
結語
Logan,謝謝你來參加節目。新東西出來的時候我們得再請你回來,看起來你們正在瘋狂地發布產品。我打賭很快就會再見面。
如果你希望Logan回來,如果你喜歡這一集,請評論並點讚這個影片。我會包含追蹤Logan社群媒體的連結,以及開始使用Google AI Studio的連結。
相關連結
- AI Studio: ai.studio/banana - 你可以試用這個模型
- Build頁面: ai.studioapps - 如果你想去建構和看所有我們建立的東西
連結會讓大家開始使用變得非常簡單。